检索结果

Select

1. 融合词义消歧的汉语句法分析方法研究

李冬晨;张献涛;樊扬;吴玺宏

北京大学学报（自然科学版） 2015, 51 (4): 577-584. DOI: 10.13209/j.0479-8023.2015.054

摘要（1315）

PDF（pc）（487KB）（351）

将句法分析与词义消歧相结合, 根据层次化语义知识的句法分析框架, 在句法分析训练过程中, 利用句法结构信息对文法模型进行调整, 解决了引入语义时所面的歧义问题, 构建一种句法分析和词义消歧的一体化方法。实验表明, 在句法分析过程中进行词义消歧处理, 使句法分析的性能显著提升, 同时也获得词将句法分析与词义消歧相结合, 根据层次化语义知识的句法分析框架, 在句法分析训练过程中, 利用句法结构信息对文法模型进行调整, 解决了引入语义时所面对的歧义问题, 构建一种句法分析和词义消歧的一体化方法。实验表明, 在句法分析过程中进行词义消歧处理, 使句法分析的性能显著提升, 同时也获得词义消歧能将句法分析与词义消歧相结合, 根据层次化语义知识的句法分析框架, 在句法分析训练过程中, 利用句法结构信息对文法模型进行调整, 解决了引入语义时所面对的歧义问题, 构建一种句法分析和词义消歧的一体化方法。实验表明, 在句法分析过程中进行词义消歧处理, 使句法分析的性能显著提升, 同时也获得词义消歧能力。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

2. 面向大语料库的语音合成方法研究

于延锁,朱风云,李先刚,刘翼,吴玺宏

北京大学学报（自然科学版）

摘要（866）

PDF（pc）（419KB）（893）

针对几百小时粗标注大语料库, 提出一种新颖的语音合成系统构建方法。首先, 借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后, 为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题, 优化了传统的训练流程, 在不损失声学模型准确性的前提下, 显著提高了模型的训练速度。主观实验表明, 与具有精标注的小语料库相比, 引入粗标注的大语料库可以带来0.5分左右的MOS提升。

相关文章 | 多维度评价 | 评论（0）

Select

3. 双耳时间差和强度差与声源距离线索关系的研究

曲天书,曹松潍,吴玺宏

北京大学学报（自然科学版）

摘要（930）

基于头传递相关函数库开展对双耳时间差和强度差与声源距离线索关联的研究。采用三组头相关传递函数库(基于KEMAR人工头的PKU&IOA HRTFs 库、基于 KEMAR 人工头但不包括耳廓的PKU&IOA HATFs 库和基于球模型的HRTF 库) , 研究了距离对双耳定位线索的影响( 包括 ITD 和 IID) 。分析结果表明, 距离在双耳定位中有非常重要的作用, 尤其在近场环境下, 距离对双耳线索的影响是明显的。

相关文章 | 多维度评价 | 评论（0）

Select

4. 一种改进的AEDA声源定位及跟踪算法

李承智,曲天书,吴玺宏

北京大学学报（自然科学版）

摘要（637）

开展了基于麦克风阵列的真实声场环境声源定位的工作。针对传统的自适应特征值分解时延估计算法收敛时间慢、对初值敏感以及不能有效跟踪时延变化等问题，提出了一种改进的自适应特征值分解时延估计算法，该方法通过改进初值设定方法，有效改善了对时延变化的估计。另外，通过引入一个基于相关运算的语音检测算法，提高了定位系统的抗噪声能力。实验表明在真实的声场环境下该算法能够对单个声源的三维空间位置进行实时的定位和跟踪，系统在 1.5m 范围内对声源的定位误差小于 8cm ，声源位置变化时，系统也能准确跟踪声源的位置。

相关文章 | 多维度评价 | 评论（0）

Select

5. 汉语韵律边界定位与选音算法研究

程勇, 吴玺宏, 迟惠生

北京大学学报（自然科学版）

摘要（746）

论述了采用统计模型进行汉语韵律层次结构分析和韵律建模的思路，将韵律结构划分为3个基本层级：韵律词，韵律短语和韵律短语群，提出了一种新的基于统计的韵律结构模型。实验表明该模型对韵律词边界的预测准确率和召回率分别达90.37%和92.48%：对韵律短语边界的预测准确率和召回率分别达82.43%和85.59%。同时，描述了一个汉语连续语流语音合成的选音算法，它适用于基于大语料库的语音合成系统。由于同时考虑单音节、二字韵律词、三字韵律词和四字韵律词，从而降低了因拼接点不连续而造成的音质损失，提高了合成语音的自然度。

相关文章 | 多维度评价 | 评论（0）

Select

6. 面向聋儿的计算机言语训练方法及其实现

刘华东, 吴玺宏, 迟惠生

北京大学学报（自然科学版）

摘要（653）

将语音信号处理和语音识别技术应用于聋儿言语训练中，设计并实现了一个适合聋儿使用的言语康复训练系统。根据聋儿言语训练的特点以及语音的声学特征和生理特征的关系，基于语音特征视觉反馈的训练方式，提出了目标训练法和对比训练法。针对聋儿的发音异常和构音异常，设计了从基础训练、构音训练到清晰度训练的计算机言语辅助训练模块。该系统在中国聋儿康复研究中心进行了初步临床实验，在中班和大班聋儿的训练上取得较好效果。实验表明根据目标训练法和对比训练法设计的计算机辅助训练方法能够有效的解决聋儿的发音异常和构音异常。

相关文章 | 多维度评价 | 评论（0）

Select

7. 语音识别和说话人识别中各倒谱分量的相对重要性

甄斌,吴玺宏,刘志敏,迟惠生

北京大学学报（自然科学版）

摘要（794）

采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度，在标准英文数字语音库上的实验表明，最有用的语音信息包含在MFCC分量C₁到C₁₂之间，最有用的说话人信息包含在MFCC分量C₂到C₁₆之间。MFCC分量C₀和C₁包含有负作用的说话人信息，将其作为特征会引起识别率的降低。低阶MFCC分量较高阶分量更容易受加性噪声和卷积噪声干扰。

相关文章 | 多维度评价 | 评论（0）